RI structurée, RI et XML, RI précise
نویسندگان
چکیده
In this paper we present a clustering method for XML documents. Our step is twophase based: we first automatically extract the structure from the document; we then use it as model of representation to classify the document that it represents. The matching of the documents’ structures is based on the calculation of their similarities. For the experimentation we used the INEX. MOTS-CLÉS: Clustering, classification structurelle, structure, arbre, similarité, contexte, nœud, index, seuil.
منابع مشابه
Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML - Évaluation d'une méthode approchée de RI structurée
RÉSUMÉ. Nous proposons des algorithmes dédiés à l’indexation et à la recherche approximative d’information dans les bases de données hétérogènes semi-structurées XML. Le modèle d’indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d’arbres. Les mécanismes de recherche approchée mis en œuvre s’appuient sur une distance de Levenshtein ...
متن کاملRéinjection de structures pour la reformulation de requêtes en RI structurée
Relevance Feedback (RF) is a technique allowing to enrich an initial query according to the user feedback. The goal is to express more precisily the user’s needs. Some open issues appear when considering semi-structured documents like XML documents. Most of the existing RF approaches are applied in the content of elements. We propose a new approach that is able to extend the initial query by ad...
متن کاملTexte et Représentation en Recherche d'Information
Les performances des modèles de Recherche d'Information (RI) sont for-tement liées à leur capacité à représenter le texte. Ces dernières années, portés par les succès en reconnaissance d'image et de parole, de nombreux modèles basés sur les réseaux de neurones et les représentations distri-buées des mots et phrases sont apparus. Quelques modèles ont essayé d'aborder le problème de la RI, dont u...
متن کاملPropositions pour la pondération des termes et l'évaluation de la pertinence des éléments en recherche d'information structurée
Structured Information Retrieval copes with a number of open issues. One can cite the evaluation of elements relevance: the aim is to return to the user a ranked list of results. This evaluation is based on the term weighting scheme and on the model used for the matching of queries and elements. In this paper, we propose to explore some clues to answer to this problem. For example, we propose t...
متن کاملRelationship between Intra-renal Arterial Resistance Index (RI) and Albuminuria in Diabetic Patients
OBJECTIVE: Diabetic nephropathy is a major diabetes complication. Arterial resistance index (RI) may predict deterioration in kidney function. This study was designed to compare renal arterial RI in different stages of renal function according to glomerular filtration rate (GFR), serum creatinine level and proteinuria. MATERIALS AND METHODS: In a cross-sectional study on 81 diabetic patients i...
متن کامل